به گزارش شهرآرانیوز؛ براساس ادعای OpenAI، مدل هوش مصنوعی GPT-۵.۵ Instant در بررسیهای داخلی پیرامون موضوعات مالی، پزشکی و قضایی ۵۲.۲ درصد کمتر از مدل GPT-۵.۳ Instant دچار توهم شده است. نرخ ادعاهای غیردقیق مدل نیز بهخصوص در مسائل چالشی که کاربران آنها را بهدلیل خطا در ارائه حقیقت نشانهگذاری کرده بودند، ۳۷.۳ درصد کاهش یافته است.
مدل جدید GPT-۵.۵ Instant در بنچمارک ریاضی AIME ۲۰۲۵ امتیاز ۸۱.۲ را بهدست آورده است. امتیاز مدل قبلی ۶۵.۴ بود. در بنچمارک استدلال چندوجهی MMMU-Pro نیز موفق به کسب امتیاز ۷۶ شده، درحالیکه مدل پیشین امتیاز ۶۹.۲ را کسب کرده بود.
OpenAI برای مدل GPT-۵.۵ Instant تأکید زیادی روی مدیریت زمینه گفتوگوها داشته است. این مدل میتواند از ابزار جستوجو برای ارجاعدادن به مکالمات قبلی، و از جیمیل برای ارائه پاسخهای شخصیسازیشده استفاده کند. البته این قابلیت فعلاً فقط برای کاربران پرو و پلاس در نسخه وب در دسترس است و بهزودی برای موبایل هم عرضه خواهد شد. این شرکت میگوید که در مراحل بعدی ظرف چند هفته آینده کاربران رایگان هم به این ویژگی دسترسی پیدا میکنند.
ChatGPT با این بهروزرسانی، منابع حافظه خود را به کاربر نشان میدهد تا مشخص باشد که پاسخها از کجا تولید شدهاند. اگر پاسخ ارائهشده اشتباه باشد، کاربر میتواند منابع منسوخ را حذف یا آنها را تصحیح کند. OpenAI به کاربران اطمینان داده است که اگر چت خود را با دیگران به اشتراک بگذارند، منابع حافظه توسط اشخاص ثالث قابل مشاهده نخواهند بود.
مدل GPT-۵.۵ Instant از همین حالا برای تمام کاربران ChatGPT عرضه شده است. توسعهدهندگان هم از طریق گزینه Chat-latest در API به این مدل از سری GPT-۵.۵ دسترسی خواهند داشت. دسترسی به مدل ۵.۳ نیز به مدت سه ماه برای کاربران پولی ادامه پیدا میکند.
منبع: دیجیاتو